keywords:"konverze hlasu" - Výsledky hledání - Digitální repozitář

host :: přihlásit Digitální repozitář
		Hledej		Nový záznam		Nápověda		O repozitáři

Hlavní stránka > Výsledky hledání: keywords:"konverze hlasu"

Hledej:

Tipy pro vyhledávaní :: Rozšířené hledání

Hledej ve sbírkách:

Seřadit podle:	Zobrazit výsledky:	Výstupní formát:

	Konverze hlasu Hodaň, David ; Novotný, Ondřej (oponent) ; Černocký, Jan (vedoucí práce) Práce se zabývá problematikou konverze hlasu, což je transformace parametrů řeči jednoho řečníka tak, aby zněl jako někdo jiný. Je proveden rozbor metod odrážejících současný stav technik konverze. V teoretické části je nejprve přiblížen způsob tvorby řeči s důrazem na atributy identifikující a charakterizující hlas. Jsou popsány metody modifikace hlasu s jejich výhodami a úskalími, jež předurčují oblast použití daných metod. Dále jsou probrány způsoby transformace hlasu mezi zdrojovým a cílovým mluvčím. Na základě popsaných poznatků je vytvořen software demonstrující jednu z cest jak tohoto cíle dosáhnout. Konverze je rozdělena z pohledu trénování a syntézy. Součástí práce je program konverze hlasu, který byl vytvořen v programovém prostření MATLAB. Postupně je v práci popsán jeho návrh, implementace a zhodnocení dosažených výsledků. Úplný záznam
	Konverze hlasu Brukner, Jan ; Plchot, Oldřich (oponent) ; Černocký, Jan (vedoucí práce) Práce se věnuje konverzi hlasu. Tedy metodě, ve které se snažíme modifikovat řečové parametry zdrojového mluvčího na cílového. V práci je nejdříve popsána Voice Conversion Challenge (VCC), ve které se účastníci snažili vytvořit co nejlepší systém pro konverzi hlasu. V další části jsou analyzovány komponenty baseline systému použitého ve VCC. Poté jsou navrženy úpravy, které mohou zlepšit kvalitu konvertovaného hlasu. Následně je stručně popsána implementace těchto úprav a vyhodnoceny výsledky změn. V závěru je část věnována dalším možnostem vylepšení konverze hlasu. Úplný záznam
	Voice Conversion Lukáč, Peter ; Glembek, Ondřej (oponent) ; Černocký, Jan (vedoucí práce) The matter of this thesis is voice conversion. Voice conversion is taking speech of one speaker, that we call source speaker and transforming it into speech that sounds as the speech of another speaker, that we call target speaker. This is accomplished using voice conversion system described in this thesis. As the framework for speech analysis and synthesis, we are using tool called STRAIGHT that was predominantly used in Voice Conversion Challenge 2016. Our voice conversion system is based on spectral conversion using feed-forward neural network and parallel training. Úplný záznam
	Non-Parallel Voice Conversion Brukner, Jan ; Plchot, Oldřich (oponent) ; Černocký, Jan (vedoucí práce) Voice conversion (VC) aims at converting the voice of source speaker to the voice of target speaker. It is popular in funny Internet videos but has also series of serious use cases, such as dubbing of audiovisual material and anonymization of voice (for example for witness protection). As it can serve for spoofing of voice identification systems, it is also an important tool for development spoofing detectors and counter-measures. Training VC models has mainly been on parallel audios (ie. two speakers uttering the same text) and on high quality audio material. The goal of this thesis was to investigate developing VC on non-parallel data and with low quality signals, mainly from publicly available dataset VoxCeleb. This work follows the state-of-the-art AutoVC architecture defined by Qian et al. It is based on neural network (NN) autoencoders, aiming to separate speech into content- and speaker-dependent embedding. The target speech is then obtained by replacing source speaker embedding by the target speaker one. We have improved Qian's architecture to process low-quality audio by experimenting with different speaker embeddings (d-vectors vs. x-vectors), introducing a speaker classifier from content embeddings in an adversarial setup, and tuning the size of content embeddings imposing an information bottleneck to the autoencoder. Also, we have defined another adversarial architecture by comparing original content embeddings with those obtained after the VC process. The results of experiments prove that non-parallel VC on low-quality data is indeed doable. The resulting audios were not so good as in case of using high-quality ones, but the speaker verification results after spoofing by proposed system have clearly shown a shift of voice characteristics toward the target speakers. Úplný záznam
	Konverze hlasu Schwarz, Ivan ; Szőke, Igor (oponent) ; Černocký, Jan (vedoucí práce) Práce je věnována tvorbě systému pro konverzi hlasu. Metodám, jež hlas jednoho člověka upraví tak, aby ho bylo možné zaměnit za hlas člověka jiného. V první části je popsán harmonický a šumový model (HNM), který se stará o analýzu a syntézu signálů. Druhá část se zabývá metodami konverze. Nejprve jsou uvedeny prozodické změny a následně i možnosti modifikace spektrální obálky, zejména použití konverzních matic. Stručně je zde vysvětlena metoda dynamického borcení času (DTW) a metoda kódování pomocí lineární predikce (LPC). V poslední části je uveden způsob implementace, popsán průběh testování a jsou diskutovány dosažené výsledky. V závěru jsou nastíněny možnosti dalšího vývoje. Úplný záznam
	Non-Parallel Voice Conversion Brukner, Jan ; Plchot, Oldřich (oponent) ; Černocký, Jan (vedoucí práce) Voice conversion (VC) aims at converting the voice of source speaker to the voice of target speaker. It is popular in funny Internet videos but has also series of serious use cases, such as dubbing of audiovisual material and anonymization of voice (for example for witness protection). As it can serve for spoofing of voice identification systems, it is also an important tool for development spoofing detectors and counter-measures. Training VC models has mainly been on parallel audios (ie. two speakers uttering the same text) and on high quality audio material. The goal of this thesis was to investigate developing VC on non-parallel data and with low quality signals, mainly from publicly available dataset VoxCeleb. This work follows the state-of-the-art AutoVC architecture defined by Qian et al. It is based on neural network (NN) autoencoders, aiming to separate speech into content- and speaker-dependent embedding. The target speech is then obtained by replacing source speaker embedding by the target speaker one. We have improved Qian's architecture to process low-quality audio by experimenting with different speaker embeddings (d-vectors vs. x-vectors), introducing a speaker classifier from content embeddings in an adversarial setup, and tuning the size of content embeddings imposing an information bottleneck to the autoencoder. Also, we have defined another adversarial architecture by comparing original content embeddings with those obtained after the VC process. The results of experiments prove that non-parallel VC on low-quality data is indeed doable. The resulting audios were not so good as in case of using high-quality ones, but the speaker verification results after spoofing by proposed system have clearly shown a shift of voice characteristics toward the target speakers. Úplný záznam
	Voice Conversion Lukáč, Peter ; Glembek, Ondřej (oponent) ; Černocký, Jan (vedoucí práce) The matter of this thesis is voice conversion. Voice conversion is taking speech of one speaker, that we call source speaker and transforming it into speech that sounds as the speech of another speaker, that we call target speaker. This is accomplished using voice conversion system described in this thesis. As the framework for speech analysis and synthesis, we are using tool called STRAIGHT that was predominantly used in Voice Conversion Challenge 2016. Our voice conversion system is based on spectral conversion using feed-forward neural network and parallel training. Úplný záznam
	Konverze hlasu Brukner, Jan ; Plchot, Oldřich (oponent) ; Černocký, Jan (vedoucí práce) Práce se věnuje konverzi hlasu. Tedy metodě, ve které se snažíme modifikovat řečové parametry zdrojového mluvčího na cílového. V práci je nejdříve popsána Voice Conversion Challenge (VCC), ve které se účastníci snažili vytvořit co nejlepší systém pro konverzi hlasu. V další části jsou analyzovány komponenty baseline systému použitého ve VCC. Poté jsou navrženy úpravy, které mohou zlepšit kvalitu konvertovaného hlasu. Následně je stručně popsána implementace těchto úprav a vyhodnoceny výsledky změn. V závěru je část věnována dalším možnostem vylepšení konverze hlasu. Úplný záznam
	Konverze hlasu Hodaň, David ; Novotný, Ondřej (oponent) ; Černocký, Jan (vedoucí práce) Práce se zabývá problematikou konverze hlasu, což je transformace parametrů řeči jednoho řečníka tak, aby zněl jako někdo jiný. Je proveden rozbor metod odrážejících současný stav technik konverze. V teoretické části je nejprve přiblížen způsob tvorby řeči s důrazem na atributy identifikující a charakterizující hlas. Jsou popsány metody modifikace hlasu s jejich výhodami a úskalími, jež předurčují oblast použití daných metod. Dále jsou probrány způsoby transformace hlasu mezi zdrojovým a cílovým mluvčím. Na základě popsaných poznatků je vytvořen software demonstrující jednu z cest jak tohoto cíle dosáhnout. Konverze je rozdělena z pohledu trénování a syntézy. Součástí práce je program konverze hlasu, který byl vytvořen v programovém prostření MATLAB. Postupně je v práci popsán jeho návrh, implementace a zhodnocení dosažených výsledků. Úplný záznam
	Konverze hlasu Schwarz, Ivan ; Szőke, Igor (oponent) ; Černocký, Jan (vedoucí práce) Práce je věnována tvorbě systému pro konverzi hlasu. Metodám, jež hlas jednoho člověka upraví tak, aby ho bylo možné zaměnit za hlas člověka jiného. V první části je popsán harmonický a šumový model (HNM), který se stará o analýzu a syntézu signálů. Druhá část se zabývá metodami konverze. Nejprve jsou uvedeny prozodické změny a následně i možnosti modifikace spektrální obálky, zejména použití konverzních matic. Stručně je zde vysvětlena metoda dynamického borcení času (DTW) a metoda kódování pomocí lineární predikce (LPC). V poslední části je uveden způsob implementace, popsán průběh testování a jsou diskutovány dosažené výsledky. V závěru jsou nastíněny možnosti dalšího vývoje. Úplný záznam

Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.

Digitální repozitář :: :: :: ::
Powered by v1.1.2
Spravuje

Tato stránka je dostupná také v následujících jazycích:
Česky English